本文是学习GB-T 33870-2017 干部人事档案数字化技术规范. 而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们
本标准规定了干部人事档案数字化人员建库、目录建库、档案扫描、图像处理、数据存储、数据验收、
数据交换、数据备份、安全管理的技术要求。
本标准适用于各级党政机关、国有企事业单位的干部人事档案数字化工作。
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文
件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 2261.1 个人基本信息分类与代码 第1部分:人的性别代码
GB/T 3304 中国各民族名称的罗马字母拼写法和代码
GB/T 7408 数据元和交换格式 信息交换 日期和时间表示法
GB 11643 公民身份号码
GB/T 18788 平板式扫描仪通用规范
SJ/T 11292 计算机用液晶显示器通用规范
全国公务员管理信息系统信息采集、报送标准 组通字〔2012〕31号
下列术语和定义适用于本文件。
3.1
干部人事档案数字化 digitalization of cadre
personnel archives
采用扫描仪等设备对干部人事档案进行数字化加工,将其转化为可存储在磁盘、光盘等存储介质
上,并能被计算机识别,数字方式可信、可取和可用的数字图像或数字文本的处理过程。
3.2
档案信息 archival information
干部人事档案中的文字、表格、照片、图章等有效信息。
3.3
数字档案管理信息系统 information system for
digitalized archives management
具有信息录入、档案扫描、图像处理、提供利用、存储备份、导入导出等功能的信息系统。
3.4
原始图像数据 the original image data
纸质档案通过扫描等方式形成数字图像后,再经过纠偏、裁边等处理后的图像数据。
3.5
优化图像数据 optimized image data
与原始图像数据一致,经优化处理达到无噪点干扰、字符灰度平均值≤125.0、模糊度≤200.0
μm
的图像数据。
GB/T 33870—2017
3.6
图像数据压缩 image data compression
清除图像数据冗余的一种过程。
3.7
背景区域 background area
衬托档案信息的区域。
3.8
图像背景颜色 background color
背景区域所呈现的颜色。
3.9
背景无关标记 background extraneous mark
背景区域中与档案信息无关的噪点。
3.10
灰度 gray scale
图像每个像素点的颜色深度。
注:灰度评价指标见附录 A。
3.11
字符灰度 character gray scale
优化图像数据档案信息区域中像素点的灰度,灰度值的范围为0~255,对应图像中的颜色为从黑
到白。
注:字符灰度评价指标见附录 A。
3.12
模糊度 blurriness
图像中线条(或字符笔画)边缘内边界和外边界的平均距离值。
注:模糊度评价指标见附录 A。
3.13
持续数据保护 continuous data protection
一种在不影响主要数据运行的前提下,可以实现持续捕捉或跟踪目标数据所发生的任何改变,并且
能够恢复到此前任意时间点的方法。
应确保干部人事档案数字化后的内容与纸质档案在内容上一致。确保档案数字化过程中档案信息
不被更改。原始图像应保留原纸张颜色、污损情况和文字修改痕迹等原始信息。
应确保数字化前后纸质档案一致,档案数字图像数量与纸质档案数量相符。
应确保数字档案可被查找、检索、呈现等,满足相关业务的要求。确保数字档案的连续性,维护其可
GB/T 33870—2017
跟踪、可回溯、可关联、可被发现和可被再用,数据链不出现断裂。
应建立身份认证体系、加密存储体系及数据流传输方式等安全保密管理机制,确保档案信息的安
全。干部人事档案数字化过程应完整记录,可查询、可追溯。档案图像数据应得到有效保护,不被非法
利用、更改或销毁。档案原件不受损毁。
数字化对象应是符合干部人事档案审核、整理等有关规定要求的合格档案。
干部人事档案数字化基本环节包括:人员建库、目录建库、档案扫描、图像处理、数据存储、数据验
收、数据交换、数据备份。其中,图像处理环节包括原始图像处理和优化图像处理,优化图像处理为可选
处理环节。
人员基本信息集的编码为:A01。
用于描述某人自然属性和社会属性中最基本的信息。编码引自
组通字〔2012〕31号文件。
该信息集为单记录信息,每一记录对应一个人。至少由6个信息项(见表1)组成,其他信息项可根
据实际情况增加。该信息集内容可单独建立,也可从其他系统中获取。
表 1 人员基本信息集
|
|
|
|
|
|
---|---|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
人员基本信息录入内容包括:
a) "姓名",填写户籍登记所用的姓名;
b) "性别",填写GB/T 2261.1 中的性别代码;
c) "民族",填写GB/T 3304 中的民族代码;
d) "出生日期",按照GB/T7408 要求的格式填写出生年月;
e) "公民身份号码",填写公安机关为公民编制的符合 GB11643
要求的身份代码。
GB/T 33870—2017
干部人事档案目录信息集的编码为:RSDAML。
用于描述档案目录的信息,由10个信息项(见
表2)组成。该信息集为多记录信息集,每一记录记述该档案目录涉及档案材料的信息。
表 2 干部人事档案目录信息集
|
|
|
|
|
|
|
---|---|---|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
应根据统一的干部人事档案目录格式进行档案目录录入,包括:
a) "类号",填写材料类号;
b) "序号",填写材料所属分类中的序号;
c) "材料名称",根据材料题目填写,无题目的材料,应拟定题目;
d)
"材料形成时间",一般采用材料落款标明的最后时间,复制的档案材料,采用原材料形成时间;
e) "页数",填写每份材料的页码数;
f) "备注",填写需要说明的情况。
扫描仪应符合 GB/T 18788 的规定,亮度和对比度为中值,无偏移。
GB/T 33870—2017
应根据纸质档案材料的具体情况,采用合理的扫描方式进行扫描。扫描方式包括(但不限于):
a)
大幅面档案宜采用大幅面扫描仪扫描,也可采用小幅面扫描后的图像拼接方式处理;
b) 纸张状况较差、容易损坏的档案,应采用平板扫描方式;
c)
对于纸张较薄的档案,若扫描时发生背页字迹透印而影响图像阅读的现象,应在背页后垫白色
衬底扫描。
应采用真彩色24位 RGB 模式扫描。
应采用300 dpi分辨率扫描。
对偏斜度大于1°的图像应进行纠偏处理,纠偏后距离显示器25 cm~40 cm
观看图像应没有明显
偏斜。对方向不正确的图像应旋转还原。
纠偏后的图像应进行裁边处理,去除扫描过程中产生的白边或黑边。
对大幅面干部人事档案材料进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个原始图
像,确保档案数字图像的完整性和真实性。
应使用计算机软件或人工方式对原始图像数据进行处理,得到优化图像数据。
原始图像中带有黑白、彩色照片的,应采用人工方式处理,以使优化图像中的照片得到更佳的视觉
效果或与原始图像的视觉效果相符。
原始图像中带有印章的图像区域应采用人工方式处理。
带有身份证、学历证件、复印件及带有防伪技术的原始图像,或内容不清晰的红色或紫色背景的早
期麻纸基材等,优化处理后仍不具有较好辨识效果的,应直接引用原始图像数据。
观看优化图像使用的显示器应符合 SJ/T11292 的要求,并调整到 sRGB
状态。在保证档案信息完
整的前提下应满足以下指标:
GB/T 33870—2017
a) 图像背景颜色为24位真彩色,且RGB 值为(254,246,197);
b) 4×4 pixels(对应300 dpi分辨率的情况约为328μm×328μm)
范围以下的背景无关标记为0 个,4×4 pixels到8×8 pixels(对应300
dpi分辨率的情况约为656μm×656μm) 范围内的背
景无关标记以不影响档案信息阅读为准,8×8
pixels范围以上的背景无关标记为0个;
注:大于8×8 pixels范围是能够分辨出该区域是否为有效信息,小于4×4
pixels范围发现有信息则认定为
无效信息,4×4 pixels到8×8
pixels之间范围内是无法分辨信息是否为有效信息,如标点符号或污点等。
c) 字符灰度平均值≤125.0;
d) 模糊度≤200.0 μm。
图像数据应采用JPEG
格式存储。原始图像数据存储时,应进行图像数据压缩,压缩率≥80%。优
化图像数据不进行压缩。
原始图像数据和优化图像数据应分不同文件夹保存。
干部人事档案图像文件在存储介质上的实际存储路径。
原始图像文件存储路径:系统指定路径\人员唯一标识\原始图像数据>
优化图像文件存储路径:系统指定路径\人员唯一标识\优化图像数据〉
数据存储索引信息集的编码为:RSDAWJ。
用于描述某页干部人事档案材料图像文件存储的最基
本信息,由4个信息项(见表3)组成。该信息集为多记录信息集,每一记录记述该档案目录涉及档案材
料图像文件的存储信息。
表 3 数据存储索引信息集
|
|
|
|
|
|
---|---|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
应对全部数字档案成品进行质量验收。
GB/T 33870—2017
10.2.1 人员建库验收标准
人员建库时录入项目应符合5.1所列人员基本信息集数据格式要求;与其他信息系统共享人员信
息的,所引用的姓名、性别、民族、出生日期、公民身份号码等信息项也应符合人员建库要求。
10.2.2 目录建库验收标准
目录建库时录入项目应符合6.1所列干部人事档案目录信息集数据格式要求,类号、序号、材料名
称、材料形成时间、页数、备注等录入内容项应规范、准确,档案目录应与纸质档案材料名称内容相符,档
案目录条数应与纸质档案材料数量相符。
10.2.3 原始图像数据验收标准
原始图像应为真彩色24位、JPEG 格式、300 dpi。
无扫描产生的白边和黑边;偏斜度≤1°,方向正
确;图像页码连续;图像中档案信息与纸质档案一致,图像数量与纸质档案一致,图像的排列顺序与纸质
档案一致,图像与目录一一对应。
10.2.4 优化图像数据验收标准
优化图像应符合8.2.2的要求,与原始图像尺寸一致。
应根据验收标准填写相应的验收登记表(样式见附录C),
对数字档案作出合格或不合格的结论。
数据交换的内容应包括:
a) 人员基本信息及目录信息的描述性文件,以 XML
格式文件保存,符合5.1、6.1的要求,其中,
人员基本信息只交换表1内的5个信息项;
b) 干部人事档案数字化形成的图像数据,存放在指定的文件夹内。
11.2.1 XML 文件格式描述
XML 根节点为\<数字档案>。整个 XML
文件包括人员基本信息及目录信息,分别用\<人员基本信
息>、\<目录信息>进行标记。人员基本信息中的内容分别用\<姓名〉、〈性别〉、〈民族>、\<出生日期>、\<公民
身份号码>进行标记。目录信息中的内容分别用\<类号〉、\<序号>、\<材料名称>、\<材料形成时间>、\<页数〉、
\<备注>、\<原始图像数据>(即图像文件名称)、\<优化图像数据>(即图像文件名称)进行标记。
XML 文件
的定义描述见附录D。
11.2.2 文件夹及文件命名规范
每个人的干部人事档案图像数据应放在一个文件夹内,该文件夹应以姓名+公民身份号码命名(如
GB/T 33870—2017
李**11010219830606****)。根目录下保存的是一个以姓名+公民身份号码命名的
XML 文件
和一个文件名为“图像数据”的文件夹,前者描述人员基本信息及目录信息,后者存放原始图像数据和优
化图像数据。
图像文件名称的命名规则为:干部人事档案材料类号代码+"一"+分类内序号+"一"+三位流水
号+后缀名,如1-1-001.jpg
(在不同的操作系统中,图像文件扩展名或显示为.jpeg)。 类号代码见附录
B。 文件夹的目录结构如图1所示。
style="width:6.77361in;height:6.59375in" />
注:圆角方框表示文件夹。
图 1 目录结构图
经验收合格的人员基本信息、干部人事档案目录信息、原始图像数据、优化图像数据应及时进行
备份。
应采用在线、离线相结合的方式实现备份。在线备份可采用持续数据保护技术,保障数据备份的持
续性。离线备份时,每个人的数字档案应形成一个数据包,数据包应采用硬盘、光盘等不同载体备份,宜
异地备份。
离线备份后应在相应的备份介质上做好标签,以便查找和管理。
GB/T 33870—2017
13.1.1 数字档案的密级和相应纸质档案的密级相同。
13.1.2
数字档案管理信息系统(以下简称"管理系统")和承载管理系统的网络的密级应不低于其所承
载的数字档案的密级。
13.2.1
数字化加工场所应设在独立、可封闭的建筑内,应符合防盗、防火、防尘、防水、防潮、防高温、防
日光及紫外线照射、防有害生物、防污染等安全管理要求。
13.2.2
应配备满足安全管理需要的视频监控设备,配备符合国家标准并满足工作需要的档案装具。
13.2.3
应配备数字化工作人员存放随身物品的专用储物箱柜,并与档案装具分区放置。
13.3.1
干部人事档案数字化加工设备(计算机、打印机、复印机、扫描仪等)的使用、管理、维修、报废等
应符合涉密信息设备使用保密管理的有关规定。
13.3.2
与干部人事档案数字化加工相关的计算机、打印机、复印机、扫描仪等设备不得连接互联网及
其他公共信息网络。
13.4.1
应建立以数字证书为核心的身份认证系统,按照密级选择安全保密方式实现用户身份鉴别。
13.4.2
管理系统应提供专用的登录控制模块对登录用户进行身份标识和鉴别,标识范围应涵盖管理
系统的所有用户。
13.4.3 管理系统不得设置匿名账户。
13.4.4
管理系统应具备用户身份标识和鉴别信息复杂度检查功能,确保管理系统中不存在重复身份
标识、身份鉴别信息不被冒用。
13.4.5
单个管理系统客户端在同一时间仅允许单个用户登录,用户在同一时间仅允许登录单个管理
系统客户端。
13.5.1 管理系统应具备涉密信息和重要信息的访问控制功能。
13.5.2
涉密信息和重要信息的访问控制,主体应控制到单个用户,客体应控制到单个页面。
13.6.1
干部人事档案数字化应进行全过程日志记录,修改和删除的图像数据应一并存入日志记录。
13.6.2
日志记录的内容应包括事件发生时间、发起者信息、类型、描述和结果等。
13.6.3 管理系统应具备安全事件审计功能,审计范围应覆盖所有用户。
13.6.4
审计事件的类型应包括系统事件、业务事件、成功事件、失败事件等。
13.6.5
管理系统应不具备单独中断审计进程功能,不能非授权删除、修改或覆盖日志记录。
13.6.6 管理系统应具备对日志数据进行自动或手动备份功能。
GB/T 33870—2017
13.7.1
管理系统应设置系统管理员,系统管理员仅负责系统级的管理,不具备任何用户业务操作的
权限。
13.7.2
管理系统应设置安全保密管理员,负责管理系统的日常安全保密管理工作,包括对用户账号权
限管理、安全保密设备管理和管理系统所产生日志的审查分析,不具备任何用户业务操作的权限。
13.7.3
管理系统应设置安全审计员,负责对系统管理员、安全保密管理员的操作行为进行审计跟踪分
析和监督检查,不具备任何用户业务操作的权限。
13.7.4
系统管理员、安全保密管理员、安全审计员应相互独立、相互制约,实行"三员分离"。
13.8.1 管理系统应采用加密技术确保存储和传输过程中数据的完整性。
13.8.2
数据在网络传输和存储中应采取相应的密码保护措施,确保数据传输和存储的安全。
13.8.3
管理系统应具备涉密信息完整性检测功能,能发现信息被篡改、伪造、删除等情况,并产生审计
日志。
13.9.1
采用外包方式开展干部人事档案数字化工作的,涉密系统集成、系统咨询、软件开发、安防监
控、运行维护、数据恢复等业务应选择具有涉密信息系统集成资质的单位,涉密档案数字化加工等业务
应选择具有国家秘密载体印制资质的单位。
13.9.2
管理系统使用之前应委托有资质的第三方信息安全测评机构开展风险评估和检测。
GB/T 33870—2017
(规范性附录)
灰度、字符灰度、模糊度评价指标
A.1 灰度评价指标
灰度的评价指标用Y(x,y) 表示,按式(A. 1) 计算:
Y(x,y)=0.3R(x,y)+0.5G(x,y)+0.2B(x,y) … … … … … …(A. 1)
式中:
Y(x,y) — — 灰度;
R(x,y) 、G(x,y) 、B(x,y)—— 彩色图像(x,y) 位置处像素的数字颜色数值。
注:改写 ISO/IEC TS 24790,定义5.3.4。
A.2 字符灰度评价指标
本标准使用整幅图像的字符灰度平均值评价优化图像字符的灰度特征。字符灰度平均值反映优化
图像数据档案信息区域字符的整体明暗水平。各灰度关系如下:
整幅图像中档案信息灰度总和记为 Ysum,按 式(A.2) 计算:
style="width:2.47328in;height:0.5533in" /> … … … … … … … … … …(A.2)
式中:
i —— 档案信息像素点;
Y(x;,y;)— 由 式(A. 1) 计算的第 i 个档案信息像素点的灰度值。
字符灰度平均值记为Y, 按式(A.3) 计算:
Y=Ysum/Psum … … … … … … … … … …( A.3)
式中:
Psum—— 整幅图像中档案信息像素的总和。
A.3 模糊度评价指标
从优化图像中选取含有一段边缘较模糊的直笔画及其部分背景的区域,计算该区域各笔画垂线的
灰度最大值 Ymax和灰度最小值Ymin,并按式(A.4) 和 式(A.5)
求得笔画两侧各自的边缘阈值Yo 和 Y₁o:
Yo=Ymin+70%(Ymax-Ymim)
Yio=Ymm+10%(Ymax-Ymi)
求取笔画两侧各自 Yo 和 Y 对应的位置坐标值G 和 Gio,Gz
相应侧边缘的模糊度记为 B, 按 式(A.6) 计算:
B=DIS7o- 10
笔画的模糊度为其两侧边缘模糊度的平均值。
… … … … … … … … … …(A.4)
… … … … … … … … … …(A.5)
到 G 的平均距离为 DIS- 10 。 笔 画
… … … … … … … … … …(A.6)
注1:改写 ISO/IEC TS 24790,定义5.3.5。
注2:如图A. 1
所示,为线条类对象(或字符笔画对象)的放大图示,该线条两侧边界存在着从边缘的内边界到外边
界的灰度过渡带,模糊度即该过渡带的平均宽度。
GB/T 33870—2017
style="width:2.67341in;height:4.43344in" />
图 A.1 线条边缘模糊特性示意图
GB/T 33870—2017
(规范性附录)
类号信息集
干部人事档案内容应分为十类:其中第四类和第九类分为4小类。分类的编号,形式为大写一到
十,其中第四类中的小类用4-1到4-4表示,第九类中的小类用9-1到9-4表示,见表B.1。
表 B.1 类号信息表
|
|
|
---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
GB/T 33870—2017
(规范性附录)
干部人事档案数字化验收登记表
干部人事档案数字化质量验收需查验人员建库、目录建库、原始图像、优化图像(可选环节)等工作
环节成果,填写《干部人事档案数字化验收登记表》,见表C.1。
表 C.1 干部人事档案数字化验收登记表
|
|
|
|
|
|
|
|
---|---|---|---|---|---|---|---|
|
|
注1:
人员建库情况、目录建库情况、原始图像情况、优化图像情况四栏依照验收标准填写发现的问题,没有问题的
填写"无";上述四栏任意栏内存在问题,则视为该人员数字档案不合格。
注2: 是否合格栏内,合格打" √ ",不合格打"×"。
注3:
验收数量较多不够填写时,可将多张表格合订在一起,在末页填写验收人和验收时间。
注4: 验收登记表应汇编成册,形成台账保存。
GB/T 33870—2017
(规范性附录)
XML 文件定义描述
干部人事档案数字化数据交换文件采用XML 格式,结构定义描述如下:
\<? xml version="1.0"encoding="utf-8"?>
\<xs:schema id="数字档案"
xmlns=""xmlns:xs="http://www.w3.org/2001/XMLSchema"
xmlns:msdata="urn:schemas-microsoft-com:xml-msdata">
\<xs:element name="数字档案" msdata:IsDataSet="true"
msdata:Locale="en-US">
\<xs:complexType>
\<xs:choice minOccurs="0"maxOccurs="unbounded">
\<xs:element name="人员基本信息"〉
\<xs:complexType>
〈xs:sequence 〉 \<xs:element \<xs:element
\<xs:element
name="姓名" type="xs:string" minOccurs="0"/>
name="性别" type="xs:string" minOccurs="0"/>
name="民族" type="xs:string" minOccurs="0"/>
\<xs:element name="出生日期" type="xs:string" minOccurs="0"/>
\<xs:element name="公民身份号码" type="xs:string" minOccurs="0"/>
\</xs:sequence)
\</xs:complexType>
\</xs:element>
\<xs:element name="目录信息">
\<xs:complexType>
〈xs:sequence)
\<xs:element name="档案目录条目" minOccurs="0"maxOccurs="unbounded">
\<xs:complexType>
\<xs:sequence> \<xs:element \<xs:element
\<xs:element
name="类号" type="xs:string" minOccurs="0"/>
name="序号" type="xs:string" minOccurs="0"/
name="材料名称" type="xs:string" minOccurs="0"/>
\<xs:element name="材料形成时间" type="xs:string" minOccurs="0"/>
\<xs:element name="页数" type="xs:string" minOccurs="0"/>
\<xs:element name="备注" type="xs:string" minOccurs="0"/>
\<xs:element name="原始图像数据" nillable="true" minOccurs="0"
maxOccurs="unbounded">
\<xs:complexType〉
\<xs:simpleContent msdata:ColumnName="原始图像数据 Text"
msdata:Ordinal="0">
\<xs:extension base="xs:string">
\</xs:extension〉
\</xs:simpleContent〉
GB/T 33870—2017
\</xs:complexType>
\</xs:element〉
\<xs:element name="优化图像数据" nillable="true" minOccurs="0"
maxOccurs="unbounded">
\<xs:complexType)
\<xs:simpleContent msdata:ColumnName ="优化图像数据 Text"
msdata:Ordinal="0">
\<xs:extension base="xs:string"〉
\</xs:extension>
\</xs:simpleContent〉
\</xs:complexType〉
\</xs:element〉
\</xs:sequence)
\</xs:complexType>
\</xs:element>
\</xs:sequence〉
\</xs:complexType〉
\</xs:element〉
\</xs:choice〉
\</xs:complexType)
\</xs:element〉
\</xs:schema>
GB/T 33870—2017
更多内容 可以 GB-T 33870-2017 干部人事档案数字化技术规范. 进一步学习